【专家干货】涂子沛:大数据思维与工业智造
以下《大数据》、《数据之巅》作者,阿里巴巴原副总裁涂子沛在首届中国(杭州)工业大数据产业发展高杨学山峰论坛上的讲话 实录。
尊敬的毛光烈主任,各位领导,各位嘉宾,大家好!很高兴来萧山交流,我第一次来,感触很深,为什么深呢?我回国之后住在城西,住在余杭,余杭现在有阿里巴巴,有海创园,有梦想小镇,所以在余杭的人有一种心态,只知余杭,只知西湖,不知萧山。但事实上萧山的数据是非常雄壮的,1800家工业企业,全省多年排第一。
最近我的一个判断,在大数据浪潮当中,制造业要开始露出头角。这次在贵阳开数博会,数博会开始之前,总理专门邀请我们一些行业的专家召开座谈会,在座谈会上总理的一些谈话,我觉得就表明了总理关注的热点、焦点,也说明了大数据下一波浪潮就是跟工业产业。
座谈会过程当中,郭台铭汇报,他汇报的主题是怎么样把工业互联网把大数据结合起来,总理打断他的话,总理问:你讲讲第一季度的指标,你们定单到底是上升了还是下降的?郭台铭没有直接回答。总理又追问:如果是下降,能不能分为两种,一种是创新的产品,一种是传统的产品,那个创新的产品有没有上升?到这里的时候,总理就说:大家看看,我这是一件个性化制造的西服,这件西服是一家国内企业帮他做的,他们都在猜是不是红领。总理又说这家企业现在有150万的数据,如果它有300万甚至更多,它的西服能做到更好。所以总理的焦点在工业制造,在个性化。他又讲:如果大数据跟工匠精神结合好,供给侧的问题就解决了。所以我认为总理今天关于大数据思想的脉络还是数据。我们今天看到大数据浪潮,在服务业,在交易端,在消费端同步发展。
我今天分享的主题是工业制造,我想从三个方面来讲。制造,造什么,怎么造,造好后还要做什么?
什么?造什么其实不是供给侧的问题,大数据能不能很好的把需求规模定义,从混沌中提炼需求。我想分享一个真实的例子,饮料。
饮料这个行业一直缺乏创新,近两年,中国饮料行业全面下降,连续两年5%,大家知道饮料当中只有一种饮料上升,其它饮料全部下降,只有纯净水是上升的,为什么上升呢?我们今天中产阶级越来越多,大家对生活品质越来越高,所以纯进口在上升,但是其它饮料在下降。
我想跟大家分享一个例子,Ocean Spray是美国一家制造企业,它怎么去生产饮料的呢?它是生产红梅汁,它怎么知道生产什么样的汁呢?它的方法第一是消费者调查,第二是大数据挖掘,第三是开放式创新。首先它是问卷调查,收集整理了过去五年的问卷调查,200万份来自160多万人的反馈,每星期都在网上对上万人进行民意调查。这个调查试图掌握消费者真正的意见,怎么掌握呢?刚刚杨教授讲了,叫数据的积累,首先基本人口统计数据超过150个字,包括年龄、性别、种族、教育、收入、是不是夜猫子等等。包括身体健康的情况,超过50个字,包括饮食、运动、体重、身体素质等等。还包括生活方式的调查等等。
(图示)这是调查的结果,它发现喜欢红莓汁的人喜欢黑甘草的味道,更可能喝维他命水,不喜欢喝能量饮料,还喜欢去国外,不喜欢去健身房运动,还有是对价格不太敏感。事实上我们消费者不知道自己想要什么,消费者心理背后无意识的诉求,没有办法用语言去表达一些东西,通过大量数据他才知道。所以这家企业对数据进行了提炼,结果是喜欢味道重的饮料,喜欢有个性的独立的包装,喜欢天然的产品,热衷户外运动,喜欢高端产品。我们的消费者,喝红莓汁的人有这些特点。这是小数据,它还在互联网上做大数据的挖掘和分析,在新媒体上做分析,它发现喜欢红莓汁的人居然喜欢嚼瓶盖,很多人想到红莓汁就想着去游泳,可以净化心灵。还有是不喜欢苏打水和添加剂,喜欢红莓汁是因为它能抗菌,会产生游泳的联想。把这两组数据叠加起来,我们又发现进一步的诉求,喜欢重口味、高端优质产品、潮流的独特的产品包装,强调产品的功效。
最后他们决定要开发一个新产品,来丰富他们的供给侧。这个新产品是什么呢?是高端优质的红莓精华素,通过咀嚼来吸食饮料,为什么咀嚼呢?因为很多人是在运动的时候,甚至在户外运动的时候来来红莓汁,因为最多的是运动员。他们利用开放式创新作为突破口,首先去查找专利,在专利过程中发现咀嚼式的这种习惯有没有,这种瓶子有没有,这查发现已经有人发明这个东西了。这个人是谁呢?把他请套企业里来,跟他共同创新,这就是今天的开放式创新。开放式创新的结果是什么呢?首先一咬就能出水。第二如水晶般透明的饮料,但着淡淡的红莓味。
所以通过这个例子,我们要智造,智从哪里来?从数据来,通过数据去决定自己要造什么。所以今天的大数据实践,要解决国家的问题,满足产业的需要,实现总理的期望,首先要说我们要生产什么。
这是讲的第一个问题。
第二个问题,我们该怎么生产?为什么数据有用?今天的工业互联网,我认为很直观的就是在生产线上布下传感器,让传感器去收集数据,为什么这么去做呢?是因为我们想通过这个数据去优化机器的效率,去节省能源。为什么这样?工业革命以来,越来越多的机器流水线在出现,这些机器都有瓶颈,什么瓶颈?效率,它到了一定的时候效率就提高不了,就优化不了,那怎么办?特别是很多机器加在一起组成一个流水线的时候,这个流水线决定了效率,它有短板。如果我们把传感器放在流水线上我们就可以获取数据,我们通过这些数据就能发现哪些机器可能要出现问题,就先把它换掉或者进行事先的修补,减少我们生产的中断。数据是什么?它表示的是历史,收集的是历史数据,通过这些历史数据能够预测未来运行情况,所以数据表示的是过去,但是表达的是未来,数据终蕴藏着规律,通过数据去预测,是我们使用数据一个最基本、最核心的一个道理。
我们今天看到越来越多的过程,商务过程、生产环境都在变成数据。为什么要变成数据?刚才杨老师讲了沈阳的数据为什么有瓶颈,因为没有数据,只有收集了大量数据之后,在这些数据积累之上才可能实现智能化,机器在数据之间自动去学习,处理一些程式化的事情,这就是智能,我们希望生产过程当中有更多智能,这是以数据为基础。所以我们今天看到在服务业、在消费端越来越多的过程变成数据,今天这个过程进入到了工业4.0,流水线上所有过程都应该变成数据。变成数据之后,我们才去分析、再现、预测,去提高机器的实效。
刚才说了,我们预测的目的是为了减少生产不中断,如果我们减少生产的中断,在杭州这里飞机引擎维护效率提高1%,全球节省2.5亿美元。能源效率提高1%,40亿美元。医疗器械效率提高1%,全省节省630亿美元,工业革命到今天,机器效率已经很难提高了,今天很多工业互联网在实施过程当中面临的一个最大问题,技术在那里,但为什么企业家不用呢?特别是很多年信息化,企业已经建立了自己的数据中心,你让他放在云上推倒重来,这个挑战就是非常大的,他会承受不了这个投入、成本和产出。
(图示)这是杭州的一家它现在在流水线上布了很多传感器,现在最大的一点心得,也是通过传感器减少了故障的发生。
挑战是什么,我认为工业互联网和服务大数据是完全不一样的,为什么不一样?服务业的大数据,比如说阿里巴巴电商平台上,很多都是交易数据,每交易一条就变成了一条数据,这条数据都是有价值的,但是在流水线上大数据不是这样,是什么样?刚才说了,工业大数据要去最终意外,防止生产的中断,去预测意外,数据体量完全不一样了,一天上淘宝上5次、6次、7次、8次,你留下7条数据、8条数据,但是在工业互联网上是每分每秒,可能是每毫秒收集数据,这个数据量是奇大无比的,价值可能是在一个例外上,可能它是正常的,我不管它,我要找的是例外,有一台数据可能出现了跟平常不一样的数据,我就要去检修。所以工业互联网数据跟服务数据是不一样的。
第二,建立各种机器数据互通,建立标准让它们流通,为什么?一条流水线上无数传感器,这些传感器必须要交流,要交换信息,所以这就需要数据来做。工业互联网有很多的数据,需要来互通。
第三,我们把传感器布到流水线上,可能不仅仅是流水线上,还有功能,通过手机、IPAD,通过各种各样的传感设备、功能的流程,我们怎么把这个流程嵌入到我们的制造流程当中去,怎么有新的规范,这是我们要考虑的。任何信息化流程最终都可以引起流程的变化,甚至引起职能的发生、团队的发生等等。
这是第一个大问题,提高绩效,节省来源。第二个我认为是个性化。有个性数据才会有个性化,这个问题很简单,围绕刚才总理举的例子,总理说他的西服是定制的,其实我在参加座谈会之前,我也第一次定制了一套个性化西服,我相信很多人已经穿过个性化西服,我是第一次穿个性化西服,我那天穿上之后感性非常强烈,我再也不想我以前的西服了,因为我从来没有感受到这么得体,包括衬衣,我穿的衬衣从来都感觉袖子长一点,但是那个衬衣袖子不长不段。所以我认为今天个性化的需求被工业化生产淹没了,其实每个人都有个性化需求,这个需求非常大。我们讲大数据,很多人说大数据是什么,大数据是一个冰山,是冰山一角,排布一下才是一个庞然大物。我们今天个性化也是这样,我们这个个性化需求被工业化、大规模生产抑制住了,一旦爆发出来这是不可估量的。
个性化是什么?是量体裁衣。老实说,我第一次听到红领的时候,那时候我的第一感觉,我觉得这个企业可能有点吹牛,后来我去了这家企业,我跟大家谈我真实的感受。我到了他的工厂里面,里面几千件西服,没有两件西服是完全一样的。因为看面料、颜色分辨不出来,但我看到一件事情,很多人的西服里面都有一个商标,很多人喜欢在这里绣上自己的名字,或者绣上自己的先生名字或者留一句话,留一个名字,这就是个性化,每件西服上的名字不一样,留的话都不一样,字体也不一样。怎么做到的呢?每个流水线数据驱动,你到这里是哪一条工序,这条工序该做什么,数据清清楚楚,送到操作员工作台上。解决方案也很简单,你就按照这个方案去驱动。成本确实是高的,但是利润增加也很大。
它现在在讲C2M,什么叫C2M?我们说个性化是怎么来的?过去我们的西服是怎么做的?是一个裁缝跑到我办公室去,量了20次才回去做的。如果是这样的话,红领去怎么推广他的模式?他必须要有用户的数据,一旦获取用户的数据,表明他跟用户之间建立了数据联系,建立了数据联系之后意味着这个用户可以直接到工厂购买一件衣服,超越所有的环节,直接把衣服打包就可以发送给客户。所以红领今天想跟阿里巴巴合作,获得阿里巴巴流量,让这些流量到它的平台上去,直接下单,生产衣服。工业大数据、个性化,我认为想象空间非常大,今天信息化的革命、数据的革命远远没有来,可能才刚刚开始,总理一再强调制造业才是核心。那我们知道,制造业的故事才刚刚开始拉开序幕。
回到我的开始,今后在杭州的人不能只知道余杭,只知道西湖,不知道萧山,制造业才是真正下一个风口。所以最近总理讲了很多,实体跟虚拟、制造跟互联网企业要融合起来,下一步怎么融合,我们萧山能不能在这方面做点探索?为全国的工业大数据、工业互联网去开拓、塑造一个典型。
个性化的制造还有一个3D打印,有数据就能智造,任何一个制造是一个数据包驱动的,这个数据包有打印机、有原材料,我们今天的主题是从工业大数据实现智造,怎么智造?未来所有产品,很多产品的改变,可能就是一行数据。我出差一到飞机上就看报纸,我的印象是关于3D打印每星期都会有一个报道。未来的智造是什么样子呢?比如我们要生产一双鞋子,主要是塑料,一双鞋子有千千万万个款式,鞋头、鞋根、鞋的花,这朵花可能是玫瑰花、茉莉花、山茶花,任何一朵花,这个改变就是一行代码。未来智造会是怎么样的?任何一款产品,可能首先是获取一个数据包,数据包可能是开放的。关于3D里面一些有意思的事情,武器的打印,把武器数据包放到互联网上,被下载了无数次,有人打印出了可以发射的武器,还带到火车上,所以数据包变成了可下载的东西,有了这个数据包接下来是谁有它的打印机,谁家里面谁有这样的打印机可以生产这双鞋子?最新的数据3D打印机已经出来了,3D打印机跟打印的素材、跟打印的素材都是挂钩的,我们今天有3万多打印机,美国已经有专门从事3D打印的咨询公司冒出来了。所以你要找到谁有生产这双鞋子的打印机,可能有很多人,你找一个离你最近的人,你把这个单子发给他,他把你这个打印出来,可能第二天一个快递就给你送过来了。
所以我认为,个性化的需求是非常大的,最终会产生的结果,我们今天讲的制造,可能未来的制造不一定发生在工厂,我认为会发生在家里。千万不要认为我们今天讲的都是未来,都是在畅想,NO,我们讲的都是现实。有一个很有名的话:未来已经来到我们中间,只是没有平均分配到生活的各个角落。今天信息化在我们生活当中带来千千万万的变化,这种变化是点点滴滴的,无声无息的,每天都在发生,真正的变化就发生在我们身边。我们要善于从生活当中去发现这些细节,察觉这种变化,未来制造可能家庭也可以。
再回到我刚刚举的例子,一双鞋子有千千万万个款式,未来工厂可能要去做一个大数据的研究,什么研究?你要生产什么,你可能因为是流水线的生产,可能就生产那10种款式,这10种款式是很多人喜欢的,还有长尾款式、千千万万个性的款式,可能这个款式只有一个人喜欢,那个款式只有100个人喜欢,你可能还不知道这100个人在哪里,你不会深挖。你可以用大数据把最流行的、销量最大的款式找出来,然后生产出来,其它所有的长尾款式让社会去生产。所以回到我刚才的话题,智造首先要解决造什么,然后才是怎么造。
最后,解决造什么,怎么造,造完了呢?造完有完了吗?今天用大数据去看造完就没有了,为什么?即使我们造完了,这些产品离开了工厂,经过了销售环节,最终到达消费者手中,你要跟他建立一个数据连接。怎么进行数据连接?未来产品可能跟传感器是一体的,数据即记忆,什么意思?当我们产品在流水线上生产的时候,我们刚刚说了,工业大数据、工业互联网就是布传感器,各种各样的传感器在记录这个产品的参数,气温、压力、工序,都记录下来了。记录下来以后怎么办?整合到它的传感器当中去,当这个产品离开工厂,到达销售人员的手中,再到消费者手中,又跟工厂建立一个链接,这个链接可能是通过产品源源不断传回来。格力就是这里,空调在你家里,空调在你家里运行的情况就会传回工厂,包括你家里的温度,所以董明珠说我未来要记录每个家庭的温度。记录温度有什么用?有什么用先打一个问号,但这是一件了不起的事情。所以这就是让产品产生记忆,让产品产生记忆有什么用呢?一旦空调发生故障,它为什么发生故障?我追诉它生产时候的参数,我把这些参数结合到一起去分析,厂家可以分析为什么这个空调有这样的故障。那对它提高自己的质量生产,这些数据会有宝贵的价值,这些产品已经出现。
(图示)这是我们国家环境保护燃煤工业锅炉节能与污染控制,这里有一个传感器,会告诉你这个锅炉的数据,包括里面的温度、运行情况,包括里面的污垢。这就是数据的传递产生价值,数据是什么?数据是对客观思路的测量和记录,数据在测量一切,在记录一切。我们要做的事情是获得更多信息,而根据这个信息来作出决策,而今天大数据能够把这些信息取回来、测回来,而且不仅取回来测回来,还实时测回来、取回来,快速传递给我们,这样价值就高了。
我关注的慢慢从服务业、消费业到工业,甚至到农业,我有一个频道,欢迎大家关注我的频道,来跟我交流意见。刚刚主持人提到,说总理在世博会上提出数据是什么,数据是钻石矿。我说我们要创新,还要创新,我们今天的数据其实还没有到位,为什么要一切业务数据化?要把一切业务变成数据,只有变成数据之后智能化才有基础,所以大数据事实上是我们进入智能社会的标志,整个智能社会是在数据的基础上建立起来的,没有数据就没有智能,无数据无智能。所以我说,数据是土壤,数据是我们进入智能社会的土壤。为什么说数据是土壤?还要从另外一个角度,我们的数据今天不仅仅要去用,还要去保护,是双方面的,就像土壤一样,我们都认识到土壤需要保护,土壤是我们的根基,万物来自于土。数据也一样,数据绝对不是像一个矿产那样一直用,开发完了就没了,数据是需要保护的,数据不能滥用。数据不仅仅是款产,矿产用完就没有了。我最近在读杨教授的《信息热》,开篇就提出来信息是什么,信息不是物质,如果我们把数据当成一种物质,当成钻石矿,钻石矿是越用越少的,数据是越用越多。钻石矿是有限的,你有了他就不能有,数据可以开放,可以共享,你有了他也可以有。更重要我要强调的,数据的重要性,我们对这件事情的认识还要上升,空间还有,上升到土壤,它是智能社会的土壤,不但需要用,还需要保护。
PPT稍后奉上